2023年计算机行业专题报告：华为算力进展不断

您所在的位置：网站首页 › 算力华为股票代码 › 2023年计算机行业专题报告：华为算力进展不断

2023年计算机行业专题报告：华为算力进展不断

2024-07-13 17:56:23| 来源: 网络整理| 查看: 265

一、昇腾计算：全栈 AI 基础设施及应用服务

2019 年的第四届华为全联接大会上，华为首次发布对计算产业的理解与战略，宣布以“一云两翼双引擎”的布局全面进军计算产业。双引擎：指鲲鹏和昇腾两大基础芯片族，构筑异构计算架构。其中鲲鹏代表通用计算，昇腾代表 AI 加速能力。两翼：指华为智能计算业务与智能数据与存储业务。1）在智能计算领域，华为面向端、边、云场景，打造“鲲鹏+昇腾+x86+GPU”的多样性算力，发布全球训练最快的 AI 训练集群 Atlas 900、AI 推理和训练卡 Atlas 300 和 AI 训练服务器 Atlas 800。 2）在智能数据与存储领域，华为融合存储、大数据、数据库、AI 能力，围绕数据全生命周期给出技术和产品支撑。一云：指华为云。通过全栈创新，提供安全可靠的混合云服务，成为生态伙伴的黑土地，为世界提供普惠算力。

1.1 全栈 AI 计算基础设施、行业应用及服务

昇腾计算产业是基于昇腾系列（HUAWEI Ascend）处理器和基础软件构建的全栈 AI 计算基础设施、行业应用及服务，包括系列处理器、系列硬件、CANN（Compute Architecture for Neural Networks，异构计算架构）、AI 计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链。

昇腾计算的基础软硬件是产业的核心，也是 AI 计算能力的来源。华为作为昇腾计算产业生态的一员，是基础软硬件系统的核心贡献者。

1）昇腾计算的硬件系统：基于华为达芬奇内核的昇腾系列处理器等多样化 AI 算力。基于昇腾处理器的系列硬件产品，如嵌入式模组、板卡、小站、服务器、集群等。

2）昇腾计算的基础软件体系：异构计算架构 CANN 及对应的驱动、运行时、加速库、编译器、调试调优工具、开发工具链 MindStudio 和各种运维管理工具等，开放给广大的开发者和客户。 AI 计算框架，包括开源的 MindSpore，以及各种业界流行的框架，作为生态的有机组成部分。同时，昇腾计算产业秉承开放的生态建设思路，支持各种计算框架对接。围绕昇腾计算体系，诞生了大量优秀应用，如互联网推荐、自然语言处理、视频分析、图像分类、目标识别、语音识别、机器人等各种场景；昇腾计算产业也拥抱各种云服务场景，支持 laas，Paas，SaaS 等多种云服务模式；同时，端边云协同的能力推动昇腾计算成为全场景的 AI 基础设施。

1.2 自有+合作硬件体系，提供澎湃算力底座

昇腾（HUAWEI Ascend）310 是一款高能效、灵活可编程的人工智能处理器，在典型配置下，半精度（FP16）算力达到 16 TFLOPS，整数精度（INT8）算力达到 8 TOPS，功耗仅为 8W。采用自研华为达芬奇架构，集成丰富的计算单元，提高 AI 计算完备度和效率，进而扩展该芯片的适用性。全 AI 业务流程加速，大幅提高 AI 全系统的性能，有效降低部署成本。昇腾（HUAWEI Ascend）910 是业界算力最强的 AI 处理器，基于自研华为达芬奇架构 3D Cube 技术，实现业界最佳 AI 性能与能效，架构灵活伸缩，支持云边端全栈全场景应用。算力方面，昇腾 910 完全达到设计规格，半精度（FP16）算力达到 320 TFLOPS，整数精度（INT8）算力达到 640 TOPS，功耗 310W。

昇腾 910 性能可对标英伟达 A100。从主流 GPGPU/ASIC 产品算力看，昇腾 910 在整型算力（INT8）可基本对标英伟达 A100 PCIe 80GB 产品。

基于昇腾 910 和 310 AI 处理器，昇腾计算产业在硬件方面坚持“硬件开放”策略，通过自有硬件和合作硬件相结合的方式为客户提供多样化选择。

自有硬件：Atlas 系列硬件产品基于昇腾处理器和业界主流异构计算部件，通过模组、板卡、小站、服务器、集群等丰富的产品形态，打造面向“云、边、端”的全场景 AI 基础设施方案，包括 Atlas 200 Al 加速模块、Atlas 200 DK AI 开发者套件、Atlas 300 Al 加速卡、Atlas 500 智能小站、Atlas 800 Al 服务器、Atlas 900 Al 集群等产品，可广泛用于“平安城市、智能交通、智能医疗、智能零售、智能金融”等领域。

合作硬件：华为将 Atlas 系列硬件开放给合作伙伴，让伙伴基于 Atlas 系列硬件进行集成和二次开发，联合打造有竞争力的产品。比如华为可以提供 Atlas 200 Al 加速模块，合作伙伴集成后形成机器人、机器狗、输电智能巡检方案等 AI 系统；华为也可以提供 Atlas 300 AI 加速卡，合作伙伴可以集成后形成 AI 服务器；华为也可以通过 OEM/ODM 的方式使能伙伴开发自有品牌的服务器整机。

1）模组和板卡：昇腾计算提供模组、板卡两种类型，其中板卡根据使用场景分为推理卡及训练卡。 Atlas 200 Al 加速模块（型号：3000）：集成了昇腾推理处理器，半张信用卡大小即可提供 22TOPS INT8 算力，可以在端侧实现人脸识别、图像分类等，广泛用于智能摄像机、机器人、无人机等端侧 AI 场景。 Atlas 300I 推理卡（型号：3000/3010）：基于昇腾推理处理器，单卡算力可达 88 TOPS INT8，目前可支持 80 路高清视频实时分析，是业界水平的 2 倍，可广泛应用于智慧城市、智慧交通、智慧金融等场景。 Atlas 300T 训练卡（型号：9000）：基于昇腾训练处理器，配合服务器，为数据中心提供强劲算力的训练卡，单卡可提供 320 TFLOPS FP16 算力，加快深度学习训练进程。具有高计算密度、大内存、高带宽等优点，适用于通用服务器。满足运营商、互联网、金融等需要 AI 训练以及高性能计算领域的算力需求。

2）智能小站：昇腾计算产业为客户和伙伴提供了基于昇腾推理处理器的智能小站 Atlas 500，具有超强计算性能、体积小、环境适应性强、易于维护和支持云边协同等特点，可以在边缘环境广泛部署，满足在安防、交通、社区、园区、商场、超市等复杂环境区域的应用需求。

3）服务器：昇腾计算提供了 Atlas 800 系列服务器和 Atlas 500 Pro 服务器。Atlas 800 推理服务器（型号：3000/3010）：基于昇腾推理处理器和鲲鹏/Intel 处理器平台，集 AI 推理、存储和网络于一体，可以容纳最大 8 张 AI 推理卡，提供最大 704 TOPS INT8 推理性能，可用于视频分析、OCR、精准营销、医疗影像分析等推理服务。 Atlas 800 训练服务器（型号：9000/9010）：基于昇腾训练处理器和鲲鹏或 Intel 处理器平台，集成 8 颗昇腾训练处理器，提供 2.24P FLOPS FP16 高算力，可广泛应用于深度学习模型开发和训练，适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。 Atlas 500 Pro 智能边缘服务器（型号：3000）：面向边缘应用，基于昇腾推理处理器和鲲鹏处理器平台，集 AI 推理、存储和网络于一体，可以容纳最大 4 张 AI 推理卡，提供 352 TOPS INT8 高 Al 推理性能，拥有 475mm 的短机箱，支持 600mm 的短机柜，可以在边缘场景中广泛部署。

4）集群：Atlas 900 Al 集群由上万颗昇腾训练处理器构成，通过华为集群通信库和作业调度平台，整合 HCCS、PCIe 4.0 和 100G RoCE 三种高速接口，充分释放昇腾训练处理器的强大性能。其总算力达到 256P〜1024P FLOPS FP16，相当于 50 万台高性能 PC 的计算能力，可以让研究人员更快的进行图像、语音的 AI 模型训练，让人类更高效的探索宇宙奥秘、预测天气、勘探石油，加速自动驾驶的商用进程。

2023 年 7 月 6 日的昇腾人工智能产业高峰论坛上，华为宣布昇腾 AI 集群全面升级，集群规模从最初的 4000 卡集群扩展至 16000 卡，是业界首个万卡 AI 集群，拥有更快的训练速度和 30 天以上的稳定训练周期，十倍领先业界。

二、算力为基，乘风而行

2.1 华为盘古等 AI 大模型落地，算力需求高涨

ChatGPT 等大模型的出现使得人工智能的发展进一步加速，世界各国正在进入百模千态时代，人工智能与千行万业的深度融合成为热点与焦点，加速行业智能化成为未来人工智能发展的主旋律。华为于 2021 年 4 月，正式对外发布华为云盘古大模型。盘古大模型达到千亿级参数，相对于以前的作坊式开发，AI 工业化开发效率可以大幅提升，同时 AI 模型具备更佳的性能。盘古大模型分为三层，L0 基础大模型，L1 行业大模型，L2 场景大模型。

L0 层是盘古的基础大模型，包括自然语言大模型（NLP）、视觉大模型（CV）、多模态大模型、预测大模型、科学计算大模型，提供了满足行业场景的多种技能。

盘古 NLP 大模型：业界首个超千亿参数的中文预训练大模型，它利用大数据预训练、对多源丰富知识相结合，并通过持续学习吸收海量文本数据，不断提升模型的效果。在实现行业知识检索回答、文案生成、阅读理解等基础功能的同时，具备代码生成、插件调用、模型调用等高阶特性，在智能客服、创意营销、会议助手、代码助手、企业信息搜索等多个典型场景，提供 AI 技术支撑。

盘古 CV 大模型：基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型，赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。

盘古多模态大模型：融合语言和视觉跨模态信息，实现图像生成、图像理解、3D 生成和视频生成等应用，面向产业智能化转型提供跨模态能力底座。

盘古预测大模型：面向结构化数据，基于神经网络 Transformer 架构，通过任务理解、模型推荐、模型融合技术，构建通用的预测能力。典型客户案例包括山东能源集团基于盘古预测大模型技术对生产数据的分析、建立洗选煤厂重介智能密控模型、实现重介分选工艺在密度控制方面的智能预测和精准控制，以及兴盛优选利用盘古预测大模型支撑不同门店、多种商品销量实时预测。

盘古科学计算大模型：面向气象、医药、水务、机械、航天航空等领域，融合 AI 数据建模和 AI 方程求解的方法，更快更准的解决科学计算问题。典型客户案例包括旺山旺水基于盘古药物分子大模型的中枢系统创新药研发，微芯生物的肿瘤领域新药研发，以及西交大第一附属医院的抗菌药研发。

L1 层是行业大模型，既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等；也可以基于行业用户的自有数据，在盘古的 L0 和 L1 上，为用户训练自己的专有大模型。 L2 层是为企业提供更多细化场景的模型，更加专注于某个具体的应用场景或特定业务，为用户提供开箱即用的模型服务。大模型发展下，算力需求有望迎来快速增长。仅考虑大模型训练成本，根据 Oneflow 的估算，GPT-3 单次训练成本约为 140 万美元；对于一些更大的 LLM 模型，训练成本单次约达到 1120 万美元。依据如下：

1）基于参数数量和 token 数量，根据 OneFlow 估算，GPT-3 训练一次的成本约为 139.8 万美元：每个 token 的训练成本通常约为 6N（而推理成本约为 2N），其中 N 是 LLM 的参数数量。假设在训练过程中，模型的 FLOPS 利用率为 46.2%，与在 TPU v4 芯片上进行训练的 PaLM 模型（拥有 5400 亿参数）一致。

2）对于一些更大的LLM模型（如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM），采用同样的计算公式，可得出，训练成本介于 200 万美元至 1200 万美元之间。

2.2 华为智车再迎突破，自动驾驶算力有望持续激增

2023 年 9 月 12 日，AITO 问界新 M7 系列正式亮相，在智能驾驶、智能座舱等带来全新体验。1）问界新 M7 搭载 HUAWEI ADS 2.0 高阶智能驾驶系统，率先实现不依赖于高精地图的高速、城区高阶智能驾驶。HUAWEI ADS 2.0 高阶智能驾驶系统，在融合感知 BEV（Bird Eye View 鸟瞰图）网络，识别白名单障碍物如车、人等物体基础上，升级 GOD 网络 2.0，拥有强大识别及处理能力，通用障碍物识别率达 99%，无需依赖在训练过程的数据标注。2）问界新 M7 智驾版配备 1 个激光雷达、3 个毫米波雷达、11 个高清视觉感知摄像头及 12 个超声波雷达，实现动静态目标（含不规则物体）的全场景和全天候感知。预计在 2023 年 12 月，城区智驾领航辅助可实现“全国都能开、越开越好开”。

HUAWEI ADS 2.0 已于 2023 年 4 月首发，经 5 个月迭代，能力实现升级。 2023 年 4 月首发，多款车型搭载。2023 上海国际汽车工业展览会即将盛大开启，华为于车展前夕首发 HUAWEI ADS 2.0。除问界 M7，HUAWEI ADS 2.0 也在 AITO 问界 M5 华为高阶智能驾驶版首发，阿维塔 11、极狐阿尔法 S･HI 版也有搭载。

持续迭代，“老练”程度不断提升。自 2023 年 4 月发布以来，HUAWEI ADS 2.0 在 AI 训练集群上构建了丰富的场景库，每天深度学习超过 1000 万 km，持续优化迭代智能驾驶算法和场景策略。截至 2023 年 9 月数据，长距离 NCA 领航 MPI（Miles Per Intervention）高达 200km，城市高架汇入汇出成功率高达 99%。国内乘用车自动驾驶正由 L2 向 L3+过渡。根据 36 氪研究院报告，得益于硬件平台和软件算法逐步成熟，新车搭载 L2 功能正在逐渐成为前装标配。据统计，2022 年我国在售新车 L2 和 L3 的渗透率分别为 35%和 9%，预计 2023 年将达到 51%和 20%。与此同时，限定场景下商用车自动驾驶有望率先进入商业化阶段。原因在于：1）商用车价格敏感度更低，B 端付费意愿更高；2）场景交通复杂程度较低及政策鼓励与放开等。

自动驾驶等级提升将同步提升算力需求。自动驾驶芯片一方面需要满足更高的安全等级，同时随着自动驾驶级别的提升，需要更高的算力支持。根据前瞻产业研究院的报告，目前 L2 级别的自动驾驶汽车需要 10 TOPS 左右的算力，L3 级别自动驾驶需 100 TOPS 左右算力，而到 L4 级别后，自动驾驶汽车芯片算力需求将大幅度提升至 1000 TOPS 以上。华为 MDC 平台赋能多级别自动驾驶场景，为目前已经量产、最大算力、最全系列的智能驾驶计算平台。华为可提供 MDC 智能驾驶计算平台，主要包括基于昇腾 SoC 的硬件、智能驾驶操作系统 AOS 和车控操作系统 VOS 及 AutoSAR 中间件，支持合作伙伴开发智能驾驶软件。华为 MDC 采用“统一硬件架构，一套平台软件，系列化产品”的产品研发规划是业内已经量产、最大算力、最全系列的专业智能驾驶计算平台。

华为自动驾驶云服务 Octopus 与智能驾驶计算平台 MDC、智能驾驶 OS 一起，发挥华为云+AI 优势，共同组成车云协同的 MDC 智能驾驶平台。平台可提供华为自研昇腾 910 AI 芯片和 MindSpore AI 框架能大幅提升训练效率：在典型的 ResNet50 网络的训练中，与现有友商的目前行业主流训练 GPU 相比，显示出接近 2 倍的训练速度提升，同时也支持业界主流的深度学习框架如 TensorFlow 和 PyTorch。此外，在超强算力加持下，自动数据挖掘功能结合预置丰富场景生成规则，还将为仿真提供更多有意义的场景，如接管，前车插入和数据丢帧。

2.3 算力基建推进，华为 AI 集群落地各地智算中心

多地紧抓人工智能基础设施建设。随着算力需求高涨，多地政府都将人工智能基础设施建设作为城市人工智能产业发展的重要抓手，为人工智能共性技术突破、中小企业良好有序发展提供基础保障。近年，通过支持各地 AI 集群中心和华为云中心的建设，华为积累了丰富的集群交付和部署经验，已经累计部署超千柜昇腾 AI 集群，是 AI 集群部署数量最多的厂商。

截止 2023 年 7 月 6 日，昇腾 AI 集群已支撑全国 25 个城市的人工智能计算中心建设，其中 15 个城市已经正式上线，6 个城市已经进行了至少一次扩容，武汉、西安、成都、大连、北京等 7 个城市公共算力平台入选首批国家“新一代人工智能公共算力开放创新平台”。

武汉人工智能计算中心：基于昇腾 AI 基础软硬件建设，于 2021 年 5 月 31 日正式竣工并投入运营，上线即算力资源满负荷使用。于 2022 年 2 月 7 日完成首次扩容，总算力达 200P，并再次饱和运营。目前，基于武汉人工智能计算中心，孵化了全球全球首个三模态大模型一一紫东•太初，全球首个遥感影像智能解译专用框架——武汉.LuoJiaNet，业界最大遥感影像样本数据集——武汉.LuoJiaSet，并成立多模态人工智能产业联盟和智能遥感开源生态联盟，为武汉孵化数百亿级智能遥感和多模态产业（大于 300 亿）。2023 年 9 月 30 日，武汉人工智能计算中心顺利完成三期扩容，算力总和达到 400P。

西安人工智能计算中心：西北首个大规模人工智能算力集群，于 2021 年 5 月正式启动建设，同年 9 月 9 日正式上线运营，一期包含 AI 算力 300P、HPC 算力 8P。截至 2022 年底，西安未来人工智能计算中心已与 170 多家企业合作，孵化了 150 多个场景化解决方案，涵盖遥感、语音、文旅等方向。

中原人工智能计算中心：河南首家、全国继深圳和武汉之后第三家建成并投用的人工智能算力中心，基于“黄河鲍鹏+昇腾技术”底座，是中原地区人工智能产业的重大算力支持基础设施。项目总投资 10 亿元，占地约 14 亩，建筑面约 2400 平方米，于 2021 年 10 月 21 日正式上线。一期建设规模为 100P AI 算力，相当于每秒十亿亿次的计算速度，未来将达到 300P AI 的计算能力。截止到 2022 年底，该中心服务中原企业客户 60 余家，高校学院客户 30 余家，科研单位 10 余家，同时还有省外活跃客户百余家，平均算力使用率在 90%左右。

南京人工智能计算中心：基于南京市委市政府的产业规划，以及华为与江北新区共建昇腾产业的合作协议，南京人工智能计算中心于 2022 年 5 月完成基础平台建设，一期规划 40P（每秒计算 4 万万亿次）算力，上线即接近饱和，当前平均算力使用率在 95%以上。截止到 2022 年 12 月，算力中心的应用已初具规模，已与 200 多家合作伙伴推出超过 150 多个人工智能解决方案。

此外，昇腾 AI 集群的成功案例还包括 300P 算力、平均算力利用率 85%以上的成都智算中心，二期扩容后总规模 140P 算力的杭州人工智能计算中心，总规划 400P 的沈阳人工智能计算中心，总规划 300P 人工智能训练算力的天津人工智能计算中心，算力规模 400P的重庆人工智能计算中心等。未来，基于昇腾 AI 集群的公共算力服务平台将算力资源有序、高效、普惠的开放给当地的企业、科研机构和高校，有效解决当地 AI 技术发展和产业智能升级的算力和服务需求。

2.4 政策护航信创产业，自主可控进一步打开需求

外部环境错综复杂，全球产业链供应链面临重塑，应换尽换、真替真用共识进一步强化。近年，美国对华先进计算和半导体的出口管制持续加码：

2022 年 10 月 7 日，美国商务部以维护国家安全为由，宣布了两项新的出口管制规定，限制中国从美获得先进计算芯片、开发和维护超级计算机以及制造先进半导体的能力。同时，通过再次修订 FDP 规则补增脚注 4 的方式，进一步扩大到 28 家实体清单企业的限制范围，其中涉及包括华为、海光信息、景嘉微等企业。

在美国的推动下，日本、荷兰分别颁发对华出口管制。根据路透社报道，2023 年 3 月 31 日，日本宣布将限制 23 种类型的半导体制造设备的出口。根据彭博报道，2023 年 6 月 30 日，荷兰 ASML 对出口到中国的芯片设备实行新的限制（有关三种 ASML 机器的出货量），规则将从 9 月 1 日起影响一些 DUV 系统的销售。

在此国际大背景下，华为作为中国信创领域巨头，行业大单不断落地。近期华为相关中标包括但不限于：中国电信 AI 算力服务器（2023-2024 年）集采：据 2023 年 8 月 22 日财联社报道，本次集采的产品品类包括 I 系列服务器以及 G 系列服务器，I 系列 CPU 采用 Intel 至强可扩展处理器，G 系列 CPU 采用鲲鹏处理器。其中，I 系列规模为 2198 台，G 系列规模为 1977 台，后者占比超过 47%。上海银行 2023 年度 PC 服务器：2023 年 7 月 13 日，上海银行发布 2023 年度 PC 服务器（ARM 架构）入围选型项目公告，采购 ARM 架构核心系统 PC 服务器、外围系统 PC 服务器。2023 年 9 月 9 日，中标结果公示，华鲲振宇、长江计算、神码云科入围，皆为华为整机合作厂商。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

2023年计算机行业专题报告：华为算力进展不断

2023年计算机行业专题报告：华为算力进展不断

今日新闻

点击排行

推荐新闻

图片新闻

专题文章